이러한 코퍼스의 텍스트는 모두가 語料를 분리하여, 품사 태깅 등을 한 후에 사용하게 되는 것이다. 따라서 단어 자동 분리는 가장 기본적인 작업인 셈이다.
3. 중국어 문헌의 자동 처리는 우선 단어 분리를 해야만, 단어 의미, 통사 구조 등 좀더 깊이 있는 언어 지식이 활용될 수 있게 되기 때문이다
자동으로 분석하여 규칙을 얻고, 미지의 데이터를 법칙을 이용하여 예측하는 알고리즘이다. 학습 알고리즘은 통계학 이론을 많이 다루기 때문에 기계학습은 추정통계학과 특히 밀접하게 연결되어 통계학습 이론이라고 한다. 알고리즘 설계에서 기계학습이론은 실현 가능한 효과적인 학습 알고리즘을
Ⅰ. 서론
현대사회는 정보의 폭발적인 증가와 과학기술의 발달로 인해 모든 사람들이 정보를 수집, 분석, 관리함에 있어 컴퓨터를 활용하지 않으면 안 되게 되었다. 이러한 시대적 상황은 정보화시대를 살아가는 구성원으로 하여금 컴퓨터에 대한 올바른 지식과 활용기능습득을 필요로 하게 하였으
자동으로 분리하는 것이 기계 번역을 위해 가장 시급히 해결해야 할 문제인데, 먼저 中國語에 있어서 단어 자동 분리가 중요한 이유를 3가지로 나누어 논술한다.
1. 단어 자동 분리는 현대 중국어 구문 분석기의 기초 작업이기 때문이다
中國語 자연 언어 처리에는 광범위한 응용 분야가 있는데, 예
Ⅰ. 개요
지난 몇 년 동안 컴퓨터계는 만약 어떤 기기가 10년 이상 되었다면 그것은 낡았다고 믿어 왔다. 이것은 특히 하드웨어 분야에서는 사실이나, 이런 견해는 소프트웨어 분야에서도 마찬가지로 유행하고 있다. 물론 지금 desk top pc는 10년이 아니라 2년이면 낡은 것이 된다. 다행히, 오늘날 소프트
1. Hans Peter Luhn
1.1 Hans Peter Luhn 생애
Hans Peter Luhn은 1896년 7월 1일에 독일 바르멘에서 태어나 정보검색에 많은 업적을 남기고 1964년 8월 19일에 사망하였다.
어렸을 적부터 창조성이 뛰어났으며, 기술적 문제, 물리학, 통계학에 관심을 보였다.
1차 대전 이후 Luhn은 더블부기기계(Duble-Entry Bookeepin
(KWIC : keyword-in-context) 개발,
정보의 선택적 제공
(SDI: Selective Dissemination of Information),
완전 텍스트 프로 세싱, 자동 발췌(요약)
단어 시소 로스의 최초 현대식 사용으로 신뢰를 얻었다.
오늘날 파생된 지식 대부분에는 KWIC 색인이 있으며 과학의 모든 분야에 SDI시스템이 있다
가. Facebook, Cyworld, Second Life 의 기업에 의해 시행되는 10가지 다른 상업적 활동을 설명하여라.
1) Advertising (광고)
- Cyworld는 2500만 가입자를 보유하고 있는 국내 최고 SNS로 국내에 모델을 사용한 CF의 광고와 인터넷 site 들에 배너 등 국내 사람들이 다양한 매체를 통하여 쉽게 볼 수 있고 접할 수 있도
[정보시스템 개발사례] 전자문서 자동요약 시스템
전자문서 자동요약 시스템은 날로 대용량화 되어가는 전문(Full-text)의 웹 페이지 자료와 매일을 자동 요약하여 줌으로써 사용자의 정보검색
효율성을 도모할 수 있는 시스템을 제시하고 구현하였다. 문서자동요약에 있어서 통계적인 기법과 전자메
Ⅰ. 개요
지역적으로 국내에서 자신의 서버에 접속하는 개인들에게 정보를 제공하거나 정보를 공유할 수 있는 장을 제공하거나 인터넷에 접속할 수 있는 계정을 만들어 주기도 한다. 따라서 국경을 초월하여 컴퓨터와 컴퓨터가 연결된 통신망과는 다르다고 할 수 있다. 어쨌든, 이용자수도 컴퓨터 통